经济师考试经济基础统计笔记(三)
三、数据特征的测度(分布的集中趋势、分布的离散程度、分布的偏态和峰度)
(一) 集中趋势的测度
集中趋势的测度,主要包括:位置平均数(众数、中位数)和数值平均数(算术平均数、几何平均数)
1. 众数:一组数据中出现次数最多的变量值;它是一个位置代表值,特点是不受数据中极端值的影响,抗干扰性强。
2. 中位数:是一组数据按一定顺序排序后,处于中间位置上的数值。
中位数位置=(N+1)/2
当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。
它将全部数据等分成两部分,也是一个位置代表值,其特点是不受极端值的影响
3. 算术平均数:也称均值,是全部数据的算术平均。它是集中趋势的最主要测度值。
(1) 简单算术平均数:等于所有数值相加之和 / 数值个数
(2) 加权算术平均数:(各组组中值*各组频数) / 频数之和
均值是一组数据的重心所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。其缺点是容易受极端值的影响。
4. 几何平均数:将一组中n个数据连乘后再开n次方。是适用于特殊数据的一种平均数,主要用于计算比率或速度的平均。实践中,主要用于计算社会经济现象的平均发展速度
(二) 离散程度的测度
1.极差:总体或分布中最大的标志值与最小的标志值之差,又称全距。
R=Xmax-Xmin
反映的是分布的变异范围或离散幅度,计算简单,运用方便,缺点是不能反映其间的变量分布情况,同时易受极端值的影响。
2.标准差和方差
标准差:各变量与其均值离差平方和的平均数的平方根。
方差就是标准差的平方。
例:一组5个数据, 1、2、3、4、5,求其标准差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;
再求离差,分别为:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2.
离差平方,分别为:4,1,0,1,4.离差平方和等于4+1+0+1+4=10
离差平方和的平均数:10/5=2,所以方差为2
把2开平方,即得标准差。
标准差和方差是应用最广泛的统计离散程度的测度方法。
极差、标准差和方差都是反映数据分散程度的绝对值,离散系数是测量数据离散程度的相对指标。
3. 离散系数:通常就标准差来计算,也称标准差系数。一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。
上例中,离散系数等于2的平方根除以3.